Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD

نویسندگان

  • Céline Alec
  • Chantal Reynaud
  • Brigitte Safar
چکیده

Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas forcément présentes dans les documents mêmes. Pour résoudre ce problème, nous proposons un processus d’annotation en deux étapes, guidé par une ontologie. La première consiste à peupler l’ontologie avec les données extraites des documents, complétées par d’autres issues de ressources externes. La deuxième est une étape de raisonnement sur les données extraites qui recouvre soit une phase d’apprentissage de définitions de concepts, soit une phase d’application des définitions apprises. L’approche SAUPODOC est ainsi une approche originale d’enrichissement d’ontologie qui exploite les fondements du Web sémantique, en combinant les apports du LOD et d’outils d’analyse de texte, d’apprentissage automatique et de raisonnement. L’évaluation, sur deux domaines d’application, donne des résultats de qualité et démontre l’intérêt de l’approche.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fouille de textes pour orienter la construction d'une ressource terminologique

Résumé. La finalité de ce papier est d'analyser l'apport de techniques de fouille de données textuelles à une méthodologie de construction d'ontologie à partir de textes. Le domaine d’application de cette expérimentation est celui de l’accidentologie routière. Dans ce contexte, les résultats des techniques de fouille de données textuelles sont utilisés pour orienter la construction d’une ressou...

متن کامل

Du texte à la base de données géographiques

Résumé. Avec la prolifération des données géographiques, il y a un fort besoin de concevoir des outils automatiques pour l’exploitation des connaissances géographiques incarnées dans les documents textuels. C’est dans ce contexte, que nous proposons une approche permettant de générer une base de données géographiques (BDG) à partir de textes. Notre approche s’articule autour de deux grandes pha...

متن کامل

L'apport de l'information spatiale pour l'enrichissement des bases de données

RÉSUMÉ. Dans ce papier, nous présentons une approche d’acquisition de connaissances pour l’enrichissement des contenus des bases de données géographiques. L’enrichissement peut s’opérer à travers l’intégration et la fusion de données de sources différentes. L’approche que nous préconisons génère des résumés à partir d’un corpus de documents en provenance du web. Nous faisons collaborer un ensem...

متن کامل

Construction d'une ontologie à partir d'une base de données relationnelle : approche dirigée par l'analyse des formulaires HTML

RÉSUMÉ. L’émergence et la généralisation du Web dans tous les domaines, a permis à de nombreuses entreprises d’offrir une variété de services et d’informations en ligne, suscitant ainsi un réel besoin de partage et d’interopérabilité. Cela nécessite une infrastructure permettant à des agents logiciels d’exploiter, de composer et de raisonner sur les contenus constituants les ressources Web. Mal...

متن کامل

De la modélisation sémantique des événements vers l'enrichissement et la recommandation

RÉSUMÉ. De nombreux sites web ont récemment connu une croissance rapide fournissant des informations à propos d’événements passés ou à venir, et pour certains d’entre eux, accompagnés de photos et de vidéos capturées pendant ces événements. L’information disponible est, cependant, souvent incomplète, erronée et enfermée dans une multitude de sites web. Notre objectif est de fouiller en temps ré...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2016